Détection de mots clés dans un flux de parole

نویسنده

  • Yassine Ben Ayed
چکیده

The automatic speech recognition currently arouses a great interest. In particular, the keyword detection which constitutes a signi cant branch of the human-machine interaction and which can help us to communicate with our machines in a natural and direct way by using spontaneous speech. This technique consists in detecting in a pronounced sentence, the keywords characterizing the application and in rejecting out-of-vocabulary words as well as hesitations, false starts etc. The work presented in this thesis report deals with problem of keyword detection in a speech ow. First of all, we propose new garbage models founded on the modelling of the out-ofvocabulary words. Second, we introduce the recognition based on loop of phonemes, in which we apply various reward functions supporting keyword recognition. Then we propose to use con dence measures in order to make the decision of rejection or acceptance of a given keyword. The various con dence measures used are based on the probability of the local acoustic observation. First, we use these probabilities to calculate the arithmetic, geometric and harmonic means as con dence measures for each keyword. Second, we propose some others con dence measures based on the loop of phonemes recognition method. Finally we present the problem of detection as a classi cation problem where each keyword can belong to two di erent classes, namely correct and incorrect . This classi cation is carried out by using Support Vector Machines (SVM) which constitute a new technique of statistical training. Each recognized keyword is represented by a characteristic vector which constitutes the entry of the SVM classi er. To determine this vector, we use the probability of the local acoustic observation and then we introduce the duration of each state. In order to improve performances, we propose hybrid approaches combining the garbage models with the con dence measures and the con dence measures with the SVM. To test our models we use the French data base SPEECHDAT. The evaluation of all results was carried out using the ROC and the recall/precision curves. The best results were obtained by the SVM based methods. The hybrid methods also enabled us to get good performances.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Recherche de documents similaires sur le web par segmentations hiérarchiques et extraction de mots-clés

Résumé. La recherche de documents similaires est un processus qui consiste à trouver les documents présentant des similitudes, comme la copie ou la reformulation, sur des bases documentaires ou sur internet. Elle est utilisée notamment pour protéger la propriété intellectuelle de productions issues de l’enseignement, de la recherche ou de l’industrie. Dans cet article, nous définissons une appr...

متن کامل

Percol0 - un système multimodal de détection de personnes dans des documents vidéo (Percol0 - A multimodal person detection system in video documents) [in French]

Percol0 A multimodal person detection system in video documents The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms ...

متن کامل

Détection de tableaux dans des documents complexes

RÉSUMÉ. Dans cet article, nous présentons les résultats obtenus par un détecteur de tableau dans le cadre des campagnes MAURDOR, pour lesquelles le corpus présente la particularité de contenir des document fortement hétérogènes dans leur mise en page, leurs scripts et les langues utilisées. ABSTRACT. This paper presents the results obtained by a table detector during the MAURDOR campaign, the c...

متن کامل

Optimality of the CUSUM Procedure

Optimality of CUSUM under a Lorden type criterion setting is considered. We demonstrate the optimality of the CUSUM test for Itô processes, in a sense similar to Lorden’s, but with a criterion that replaces expected delays by the corresponding KullbackLeibler divergence. Key-words: CUSUM, change-point, disorder problem, Kullback-Leibler divergence, sequential detection. Optimalité de la Procédu...

متن کامل

Un outil de détection automatique de thèmes

Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...

متن کامل

Analyse de Programmes Malveillants par Abstraction de Comportements. (Analysis of Malware by Behavior Abstraction)

ion de Comportements par Réécriture de Mots Nous avons vu, en Section 1.2, que l’analyse comportementale classique opérait directement au niveau des interactions observées (les appels de librairie, les appels systèmes...), ce qui rend la détection de comportements suspects peu robuste puisque la moindre modification dans la mise en œuvre d’une fonctionnalité permet de faire échouer la détection...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2003